接下來這幾天要進入實作,先來找一個資料集然後一起複習一下之前說的匯入資料的步驟吧!
我找資料集的地方是政府資料開放平臺,這個平台經由政府資料的開放,可促使跨機關資料流通、提升施政效能、滿足民眾需求,以強化民眾監督政府的力量。資料開放的類型以便利及提升民眾生活品質為優先,例如食、醫、住、行、育樂、就業、文化、經濟發展和生活品質等,透過政府資料開放,促成跨機關與民間協同合作與服務創新,創造民眾、政府、業界三贏局面。裡面提供了很多開放的資料,進入會看到:
在資料集裡選擇想要的資料並下載,這次實作我選擇的是各縣市首次生產婦女之平均年齡:
下載好需要的檔案後,回到colab
#匯入檔案
from google.colab import files
uploaded = files.upload()
讀取資料,了解資料的結構、列、欄,以及每個欄位的意義,這是建立數據理解的第一步。
#檢視檔案
import pandas as pd
data = pd.read_csv('file.csv')
print(data.head(30))
選擇完資料集,明天一起來處理資料吧!